1 Objectif

L’objectif de cette cinquième série de modèles est de commencer à approcher la notion d’espace social grâce à des analyses factorielles (ACM).

2 Analyses

L’espace social des pauvretés monétaire, institutionnelle et subjective des données du Baromètre se structure en deux principaux axes dont l’interprétation (délicate) pourrait être la suivante :

Gauche / Bas Droite / Haut
Axe 1 Richesse (objective et ressentie) Pauvreté (objective et ressentie)
Axe 2 Vulnérabilité vis à vis de la pauvreté / halo / risque ressenti de devenir pauvre Ancrage dans la richesse / pauvreté

On voit nettement que le sentiment de pauvreté se situe à droite et le sentiment de risque de pauvreté se situe en bas, arguments qui permettent de conforter un peu l’interprétation faite de ces axes.

Voir les résultats statistiques plus bas.

Mais attention, tout cela est surtout le signe d’un effet Guttman

3 Code et résultats

#chargement des packages
library(knitr)
library(dplyr) #manipuler les bases de données
library(FactoMineR) #pour les analyses factorielles
library(explor) #contient FactoMineR
library(RColorBrewer) #palettes de couleur
library(fastcluster) #pour la CAH
library(ade4) #pour la fonction s5 de plot des classes de CAH
library(poLCA) #pour les Latent Categorical Variables (pour utiliser les graphs à batons)

3.1 Pauvreté monétaire, institutionnelle et subjective

3.1.1 Variables actives

actives_autres <- c("quantile_nivie", "presta_rsa","presta_chomage","presta_apl")
actives_subj <- c("subj_pauvrete_et_risque", "subj_inf_mini_decla")
actives <- c(actives_subj,actives_autres)
passives <- c("revenus_financiers","revenus_locatifs","presta_handi","statut_occup", "diplome", "conn_rsa","annee_fac", "prof_statut_act", "age_tranche","vie_fam")

bdd_acm <- bdd_logit %>% 
  dplyr::select(c(all_of(actives),all_of(passives))) %>% 
  tidyr::drop_na()
res.mca <- MCA(bdd_acm,quali.sup=(length(actives)+1):(ncol(bdd_acm)),
               graph=FALSE) 
#explor(res.mca)
res <- explor::prepare_results(res.mca)

Les trois premiers axes de l’ACM (qui conservent respectivement 24,7, 12,4 et 10,8 % de l’inertie) sont les suivants. Le saut d’inertie entre les axes 2 et 3 est faible et les résultats de l’axe 3 nous invitent à structurer l’espace uniquement selon les deux premières dimensions.

  • Le premier axe (horizontal figure 1) oppose clairement à droite les personnes pauvres monétairement (premier quintile de niveau de vie), institutionnellement (RSA en particulier et APL et allocation chômage dans une moins mesure) et subjectivement (sentiment de pauvreté et revenu inférieur au minimum déclaré) et à gauche les personnes plus riches (Q5,Q4, non pauvre, non inférieur au minimum déclaré, et dans une moindre mesure n’étant pas bénéficiaires de prestations sociales).

  • Le deuxième axe (vertical) est assez original à interpréter. Avec les Q1 et Q5 qui sont au même niveau en haut et s’opposent aux Q2 et Q3 en bas. Une interprétation probable est que cet axe semble opposer les personnes très riches (Q5) ou très pauvre (Q1, RSA, sentiment de pauvreté) en haut de l’axe à des personnes légèrement moins pauvres mais vulnérables, pouvant basculer dans la pauvreté en bas (Q2, Q3, risque ressenti de pauvreté dans 5 ans, au chômage).

  • [Le troisième axe (horizontal figure 2) ne se structure que par rapport aux quintiles de niveau de vie mais oppose Q2 + Q5 (à droite) à Q3 + Q4 (à gauche). Son interprétation en est rendu difficile et brouillerait le message des deux premiers axes.]

xlim <- c(-1.61, 2.74)
ylim <- c(-2.28, 2.07)
explor::MCA_var_plot(res, xax = 1, yax = 2, var_sup = TRUE, var_sup_choice = NULL,
    var_lab_min_contrib = 0, col_var = "Variable", symbol_var = "Type", size_var = NULL,
    size_range = c(10, 300), labels_size = 10, point_size = 56, transitions = TRUE,
    labels_positions = NULL, labels_prepend_var = FALSE, xlim = xlim,
    ylim = ylim)
explor::MCA_var_plot(res, xax = 3, yax = 2, var_sup = TRUE, var_sup_choice = NULL,
    var_lab_min_contrib = 0, col_var = "Variable", symbol_var = "Type", size_var = NULL,
    size_range = c(10, 300), labels_size = 10, point_size = 56, transitions = TRUE,
    labels_positions = NULL, labels_prepend_var = FALSE, xlim = xlim,
    ylim = ylim)

Axe 1

Axe 2

Axe 3

Ci-dessous quelques nuages des +11 000 individus colorés selon certaines variables catégorielles actives. On voit sur ce nuage uniquement quelques centaines d’individus car nombre d’entre eux se ressemblent selon les variables actives (peu de variables et donc souvent mêmes modalités répondues).

  • Pour les quintiles de niveau de vie, rien de plus à ajouter que ce qui a été dit au-dessus, avec un positionnement en “cuvette” permettant de distinguer les deux dimensions de pauvreté et vulnérabilité potentielle
  • Pour le RSA, l’opposition se fait entre droite et gauche de l’ACM (pauvreté versus richesse).
  • Même remarque pour les APL, avec une distinction moins nette que pour le RSA.
  • Pour les allocations chômage, l’opposition est davantage entre haut et bas de l’ACM (vulnérabilité potentielle versus situation de richesse / pauvreté ancrée).
  • L’indicateur subj_pauvrete_et_risque qui rassemble sentiment de pauvreté (indiquer se sentir pauvre, à droite) et risque de pauvreté (indiquer ne pas se sentir pauvre mais penser risquer l’être dans les 5 prochaines années, en bas) a un positionnement en triangle qui illustre l’importance fondamentale que cette variable a dans la constitutions des deux axes
  • L’indicateur du niveau de vie inférieur à un niveau de vie minimum pour vivre déclaré se différencie selon les deux aspects et fait probablement la synthèse / l’entre-deux entre les modalités de l’indicateur précédent.

3.1.2 Variables supplémentaires

Axe 1

Axe 2

Axe 3

3.1.2.1 Autres indicateurs de pauvreté monétaire

(ou plutôt richesse comme il s’agit des revenus financiers et locatifs).

Quand on les met en variables actives, elles déterminent un axe à elles seules de par leur spécificité. Je les ai donc gardées en supplémentaires.

En supplémentaires, ces deux variables se rapprochent de Q5 et Q4. En revanche, l’absence de revenus de location et financier se rapproche du centre de l’ACP. C’est assez logique dans le sens ou ces types de revenus concernent des personnes fortunées.

3.1.2.2 Professions et statuts d’emploi

Les professions et statuts d’emploi ont des positions assez marquées sur les axes de l’ACM comparées aux autres variables en supplémentaire.

  • Les cadres supérieurs et professions libérales sont en haut à gauche (ancrage dans la richesse)
  • Les chômeurs, personnes au foyer et autres inactifs sont situé à droite au milieu (pauvreté).
  • Les ouvriers et employés sont situés en bas au milieu (vulnérabilité potentielle).

3.1.2.3 Vie familiale et tranche d’âge

Vie familiale et tranche d’âge se positionnent selon la même logique, en particulier selon l’axe horizontal.

  • Les couples sans enfant sont en légèrement en haut et à gauche (relatif ancrage dans la richesse)
  • Les personnes âgées sont situées à relativement à gauche au milieu (richesse relative) alors que les enfants et jeunes sont situés à droite au milieu (pauvreté relative)
  • Les chefs de famille monoparentale sont situés à gauche et plutôt en haut (ancrage dans la pauvreté)
  • Les couples avec enfant en haut au milieu (richesse moyenne et peu vulnérable par rapport à la pauvreté).

3.1.2.4 Autres variables qui se démarquent peu

Ce dernier graphique présente les dernières modalités, qui se démarquent peu sur cette ACM. Le graphique a d’ailleurs été zoomé car tout s’agglutinait au centre des deux axes. Quelques variables particulières à noter cependant :

  • Les diplômés de bac+3 et plus sont plutôt en haut à gauche (ancrage dans la richesse)
  • Les diplômés de bac+2 et propriétaires plutôt à gauche au milieu (richesse)
  • Les personnes qui touchent les allocations liées aux handicap sont plutôt en bas à droite (pauvreté et vulnérabilité)
  • Les personnes locataires, surtout de HLM sont situés à droite au milieu (pauvreté sans vulnérabilité/ancrage particulier)
  • Les personnes peu diplômées (CAP/BEP ou moins) sont situées en bas et légèrement à droite (légère pauvreté et vulnérabilité)

3.2 CAH

3.2.1 Sur les deux premiers axes factoriels

donnees <- res.mca$ind$coord[,c(1,2)]
arbre <- hclust(dist(donnees), method = "ward.D2")
inertie <- sort(arbre$height, decreasing = TRUE)
plot(inertie[1:20], type = "s", xlab = "Nombre de classes", ylab = "Inertie")
points(c(2, 3, 5,6), inertie[c(2, 3, 5,6)], col = c("green3", "red3", "blue3","yellow3","pink3"), cex = 2, lwd = 3)

plot(arbre, labels = FALSE, main = "Partitions selon le nb de classes", xlab = "", ylab = "", sub = "", axes = FALSE, hang = -1)
rect.hclust(arbre, 2, border = "green3")
rect.hclust(arbre, 3, border = "red3")
rect.hclust(arbre, 5, border = "blue3")
rect.hclust(arbre, 6, border = "yellow3")

typo <- cutree(arbre,6)
s.class(res.mca$ind$coord[,c(1,2)], as.factor(typo), col = brewer.pal(7, "Set1"), sub = "Axes 1 et 2")

for(i in 1:length(unique(typo))){
  poLCA.makeplot.poly.oneclass(creer_x(typo),i)
}

3.2.2 Sur tous les axes factoriels

donnees <- res.mca$ind$coord
arbre <- hclust(dist(donnees), method = "ward.D2")
inertie <- sort(arbre$height, decreasing = TRUE)
plot(inertie[1:20], type = "s", xlab = "Nombre de classes", ylab = "Inertie")
points(c(2, 3, 5,6), inertie[c(2, 3, 5,6)], col = c("green3", "red3", "blue3","yellow3","pink3"), cex = 2, lwd = 3)

plot(arbre, labels = FALSE, main = "Partitions selon le nb de classes", xlab = "", ylab = "", sub = "", axes = FALSE, hang = -1)
rect.hclust(arbre, 2, border = "green3")
rect.hclust(arbre, 3, border = "red3")
rect.hclust(arbre, 5, border = "blue3")
rect.hclust(arbre, 6, border = "yellow3")

typo <- cutree(arbre,6)
s.class(res.mca$ind$coord[,c(1,2)], as.factor(typo), col = brewer.pal(7, "Set1"), sub = "Axes 1 et 2")

for(i in c(1,3,4,5,2)){ #1:length(unique(typo))
  poLCA.makeplot.poly.oneclass(creer_x(typo),i)
}

3.3 Essai avec davantage de variables actives

=> Effet Guttman criant.

“Il ne faut pas s’extasier” (Cf. biblio Cibois) devant cet effet Guttmann qui indique simplement une forte liaison entre les différentes réponses de l’enquête. En quelques sortes, toutes les modalités sont prises par les mêmes individus typiques à droite et à gauche. Finalement, c’est le bas de l’effet Guttmann qu’il est souvent intéressant d’analyser, c’est-à-dire ici le risque de pauvreté future qui concernent les gens avec niveaux de vie intermédiaires.

Cet effet oppose traditionnellement deux axes :

  • Axe 1 : Les très riches versus les très pauvres
  • Axe 2 (artificiel) : les situations extrêmes versus moyennes.

4 Notes méthodologiques

Pour ces modèles quatre vagues du Baromètre ont été empilées : 2016, 2017, 2018 et 2019 (12 114 observations) mais seules 10 555 observations sont conservées (celles qui n’ont aucune variable manquante pour l’ensemble des variables utilisées, actives comme supplémentaires).

Bibliographie